打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集
在文本引导的图像编辑的工作中,GPT4-o 和谷歌 Nano-banana 都能够实现令人惊艳的编辑效果,保留原图像的特征,实现高质量的新图像的生成。尤其是 Nano-banana,真正能被成为图像编辑的里程碑和新标杆。
在文本引导的图像编辑的工作中,GPT4-o 和谷歌 Nano-banana 都能够实现令人惊艳的编辑效果,保留原图像的特征,实现高质量的新图像的生成。尤其是 Nano-banana,真正能被成为图像编辑的里程碑和新标杆。
青岛日报社/观海新闻10月23日讯 近日,国家数据局发布首批《高质量数据集典型案例》名单,由中国科学院海洋研究所牵头,联合中国科学院大气物理研究所、中国科学院南海海洋研究所共同申报的“全球海洋环境变化关键参数高质量数据集”入选。
这项由上海交通大学的郝锦坤、上海人工智能实验室的梁乃富和许旭东等研究人员组成的团队在2025年9月发表的研究,首次提出了一个革命性的解决方案。该论文发表在计算机视觉顶级会议上,论文编号为arXiv:2509.22281v1,为机器人训练开辟了全新道路。
这项突破性研究由莫斯科国立罗蒙诺索夫大学、俄罗斯高等经济学院以及亚美尼亚力学研究所的联合团队完成,第一作者是安东·科努申(Anton Konushin),通讯作者是达尼拉·鲁霍维奇(Danila Rukhovich)。这项名为"TUN3D: Towards R
在全球化快速发展的今天,人工智能正在成为连接不同语言和文化的重要桥梁。然而,现有的AI系统往往存在一个令人困扰的问题:它们在英语世界表现出色,但一旦面对其他语言,特别是那些资源相对稀缺的语言时,就显得力不从心。这项由微软公司的Pranjal A. Chital
近日,Hugging Face 联合英国牛津大学团队发布了 LeRobot,这是一个旨在与整个机器人技术栈实现端到端集成的开源库,业内将其称为是「机器人界的 PyTorch」。LeRobot 支持机器人从大规模多模态数据比如文本、视频和传感器中学习,适配于多种
该论文的第一作者和通讯作者均来自北京大学王选计算机研究所,第一作者为博士生蔡鑫豪,通讯作者为博士生导师刘洋。团队近年来在 TPAMI、IJCV、CVPR、ICML 等顶会上有多项代表性成果发表,多次荣获国内外多模态理解与生成竞赛冠军,和国内外知名高校、科研机构
模型 可视化 交互 数据集 interactmove 2025-10-20 17:44 4
近日,浙江日报报业集团与浙报数字文化集团股份有限公司正式签署《数据使用授权协议》。浙数文化获浙报集团所有媒体自成立以来的全部媒体内容数据资源使用授权。媒资数据主要指浙报集团各媒体采集和刊发的文字、图片、视频影像数据等,包括超10亿条历史存量数据和后续采集和生产
从政策支持到技术创新,从标准制定到产品落地……当前,具身智能机器人产业正以蓬勃之势快速发展。在长三角,多座城市依托政策支持、技术积累与产业生态优势,正加速推动具身智能从实验室走向规模化应用。发力标准化建设,构建产业生态“地基”据相关研究机构预测,到今年年底,我
现在大火的视觉Transformer模型,层数堆多了确实能“全局掌控”,可一到分割图像、检测物体,边缘细节反倒越来越糊。
这项由阿里巴巴集团AMAP团队的季宇翔、马子瑜等研究人员以及厦门大学、南方科技大学学者共同完成的研究发表于2025年1月,论文编号为arXiv:2509.21240v1。有兴趣深入了解的读者可以通过该编号查询完整论文。
本文针对语义分割模型因图像方向任意性导致性能下降的难题,提出了一种即插即用的基于填充的旋转等变卷积模式(PreCM)。该模块基于严谨的群论推导,能直接替换现有网络中的卷积层,使其获得严格的旋转等变性,从而显著提升模型在旋转干扰下的鲁棒性与分割精度。>>更多资讯
本次大赛整体设四大赛道,包括数据技术创新赛道、高质量数据集和可信数据空间建设创新赛道、行业大模型创新赛道、工业智能体与具身智能创新赛道。
为充分发挥我市在算力资源及数据标注领域的独特优势,构建“数据—算力—模型—应用”全链条生态,推动人工智能与实体经济深度融合,培育壮大新质生产力,市政府办公室日前印发了关于《大同市促进人工智能产业高质量发展若干措施》的通知。
全球每年产生的科学数据中,高达90%从未得到充分利用就永远消失在实验室的硬盘和文件柜中。这一惊人比例不仅代表着巨大的资源浪费,更意味着无数可能推动人类进步的重要发现被埋没。为了扭转这一局面,开放科学出版商Frontiers于10月13日正式推出了FAIR²数据
在我们日常刷短视频的时候,经常会遇到这样的情况:想要快速找到某个精彩片段,但需要在几分钟甚至几小时的视频中反复拖拽进度条。如果有一个智能助手能够准确理解你的描述,瞬间定位到"那个人开始做饭的时刻"或"球员进球的瞬间",那该多好!最近,来自南开大学计算机科学学院
这项由印度理工学院海德拉巴分校自然语言与信息处理实验室的普拉米特·萨胡、马哈拉杰·布拉马和毛嫩德拉·桑卡尔·德萨卡尔三位研究者共同完成的研究,发表于2025年9月的计算语言学顶级会议上。想要深入了解这项研究的读者可以通过论文编号arXiv:2509.17399
这项由亚马逊公司西雅图贝尔维尤分部的首席科学家Mandip Goswami独立完成的研究发表于2025年9月23日,研究成果以数据集的形式发布在Zenodo平台,DOI编号为10.5281/zenodo.17172015。有兴趣深入了解的读者可以通过该DOI编
这项由浙江大学张雪乔、罗亚伟等研究人员完成的研究发表于2025年9月,论文编号为arXiv:2509.15233v1。这是人工智能角色扮演领域的一项开创性工作,有兴趣深入了解的读者可以通过该编号查询完整论文。
这项由浙江大学赵灿宇、李晓曼、冯天健、赵智越、陈浩等研究者,以及浙江工业大学沈春华团队合作完成的研究,发表于2025年8月20日的arXiv预印本(编号:arXiv:2508.14811v1),为3D场景编辑带来了革命性突破。感兴趣的读者可以通过该编号查询完整